視覴 (GPT語録)
文字コードが混ざったのが原因かも?らしい
使われ方を見ると、「視覚」または「視聴」の意味らしい。そこで、「視覴」「視覚」「視聴」のUTF-8バイト列およびChatGPTで使われているcl100k_baseエンコーディングによるトークンを調べてみる。 視覴 e8 a6 96 e8 a6 b4 |25038|244|25038|112|
視覚 e8 a6 96 e8 a6 9a |25038|244|25038|248|
視聴 e8 a6 96 e8 81 b4 |25038|244|36735|112|
どうやら「覚」の前半と「聴」の後半が交差してくっついたみたいである。